Dictionnaire automatique et dictionnaire-Machine: une Hypothese
نویسنده
چکیده
1. Pendant quatre ans le groupe de recherche linguistique du C N U C E a produit un dictionnaire automatique de la langue italienne, c'est-fi-dire tree liste de toutes les formes, lemmatis~es et enregistr~es sur m~moire p6riphdrique. Pour cette production on a employS: a) une liste d'entr~es d6crites soit sous raspect lexical, soit sous l'aspect .morphologique; b) des programmes de flexion portant soit sur des r~gles g~n~tales, soit sur l'interrogation de codes morphologiques particuliers de l'entr6e. Etant donnd qu'un tel dictionnaire a 6t6 projet6 pour &re employ~ dans les procedures de lemmatisation automatique, ~ l'heure actuelle il est utilisable, bien qu'il puisse &re consid6r6 termin6 ou non termin6 suivant le degr6 de precision de la lemmatisation que l'on veut obtenir et le degr6 de sophistication des procddures que l'on veut employer pour lemmatiser. Mais on s'attend aussi ~ ce qu'il soit employ~ comme partie d'une machine pour l'analyse linguistique d'un texte. Cet emploi demande une predisposition du dictionnaire ~l fournir non seulement des donn6es sur l'accord morphologique dans la phrase, mais aussi des traits de s61ection qui permettent de r~duire le hombre trop dlev6 de s~quences possibles ~l un hombre plus proche de celui des phrases grammaticales de fa~on h nous mettre en condition d'exercer un choix plus fin entre arbres alternatifs.
منابع مشابه
Les Triggers Inter-langues pour la Traduction Automatique Statistique. (Inter-lingual Triggers for Statistical Machine Translation)
Dans cet article, nous décrivons le concept de triggers inter-langues. Nous expliquons ensuite comment nous avons utilisé de tels triggers pour construire automatiquement un dictionnaire bilingue. Nous avons par la suite évalué notre dictionnaire bilingue en le comparant à deux dictionnaires existants, le premier fourni par ELRA et le second en libre accès sur Internet. Cependant, afin de rendr...
متن کاملA Methodology for semi-automatic structuring of a bilingual lexicographical corpus: the French-Kabyle case (Méthodologie pour la structuration semi-automatique du corpus dans une perspective de traitement automatique des langues : le cas du dictionnaire français-kabyle) [in French]
Résumé L’objectif de cette contribution est de proposer une méthodologie nouvelle de structuration de corpus à l’aide d’outils informatiques récents permettant aux linguistes non-spécialistes en informatique de constituer des corpus structurés en vue de leur exploration par des outils de traitement automatique des langues naturelles. Il s’agit, plus exactement, de présenter le processus d’infor...
متن کاملA la recherche d'un modele de Derivation en Italien
Les travaux de rtorganisation du Dictionnaire Machine de rltalien se divisent en plusieurs branches dont l'tme, la plus indtpendante du point de vue des r~sttltats, scientifiques, est la recherche d'un module de d~rivation. Nous nous limitons dans cet expos6 aux mots suffixds. 1. Notre point de dtpart est le dictionnaire de l'Italien et tionnaire Machine fi notre disposition, et la recherche se...
متن کاملAssignation automatique de solutions à des classes de plaintes liées aux ambiances intérieures polluées
Résumé. Nous présentons dans cet article un système informatique pour le traitement des plaintes en lien avec des situations de pollution domestique écrites en français. Après la construction automatique d’une base de scénarii de plaintes, un module de recherche apparie la plainte à traiter à la thématique de la plainte la plus similaire. Enfin, il s’agit d’assigner au problème courant la solut...
متن کاملA dictionary and a grammar of French compounds (Un dictionnaire et une grammaire de composés français) [in French]
The paper introduces two resources for NLP, available with a GPL license: a dictionary of French compound words and a NooJ grammar which specifies a subset of compound patterns. Mots-clés : open source, ressources, dictionnaire, grammaire, mots composés
متن کامل